מגמת "גילוי ואיתור מידע דיגיטלי"

Similar documents
עיבוד שפות טבעיות מבוא

Rules Game (through lesson 30) by Nancy Decker Preparation: 1. Each rule board is immediately followed by at least three cards containing examples of

Advisor Copy. Welcome the NCSYers to your session. Feel free to try a quick icebreaker to learn their names.

A R E Y O U R E A L L Y A W A K E?

מבוא לתרבות סייבר שיעור מס

Hebrew Ulpan HEB Young Judaea Year Course in Israel American Jewish University College Initiative

FILED: NEW YORK COUNTY CLERK 07/16/2014 INDEX NO /2014 NYSCEF DOC. NO. 134 RECEIVED NYSCEF: 07/16/2014 EXHIBIT 37

קשירות.s,t V שני צמתים,G=(V,E) קלט: גרף מכוון מ- s t ל- t ; אחרת.0 אם יש מסלול מכוון פלט: הערה: הגרף נתון בייצוג של רשימות סמיכות.

THINKING ABOUT REST THE ORIGIN OF SHABBOS

FILED: NEW YORK COUNTY CLERK 07/16/2014 INDEX NO /2014 NYSCEF DOC. NO. 102 RECEIVED NYSCEF: 07/16/2014 EXHIBIT 5

הטכנולוגיה בחינוך ד ר קובי גל אוניברסיטת בן גוריון בנגב

A JEW WALKS INTO A BAR: JEWISH IDENTITY IN NOT SUCH JEWISH PLACES

SEEDS OF GREATNESS MINING THROUGH THE STORY OF MOSHE S CHILDHOOD

אנגלית (MODULE E) בהצלחה!

JUDAISM AND INDIVIDUALITY

אנגלית שאלון ז' ג רסה א' הוראות לנבחן בהצלחה! )4( ההנחיות בשאלון זה מנוסחות בלשון זכר ומכוונות לנבחנות ולנבחנים כאחד. (MODULE G)

מספר השאלון: Thinking Skills נספח: כישורי חשיבה )לפרק ראשון ושני( א נ ג ל י ת (MODULE F) ספרות )מילון הראפס אנגלי-אנגלי-ערבי(

eriktology The Writings Book of Ecclesiastes [1]

Interrogatives. Interrogative pronouns and adverbs are words that are used to introduce questions. They are not inflected for gender or number.

eriktology Torah Workbook Bereshiyt / Genesis [1]

שאלות חזרה לקראת מבחן מפמ"ר אינטרנט וסייבר

Patents Basics. Yehuda Binder. (For copies contact:

Summing up. Big Question: What next for me on my Israel Journey?

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE D) ספרות או מילון אנגלי-עברי-עברי-אנגלי

ASP.Net MVC + Entity Framework Code First.

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE D) ספרות מילון אנגלי-אנגלי-עברי או מילון אנגלי-עברי-עברי-אנגלי

מכונת מצבים סופית תרגול מס' 4. Moshe Malka & Ben lee Volk

שאלון ד' הוראות לנבחן

מבוא לתכנות ב- JAVA תרגול 7

אנגלית ספרות בהצלחה! /המשך מעבר לדף/ נספח: כישורי חשיבה )לפרק ראשון ושני( או: מילון אנגלי-ערבי / ערבי-אנגלי או: מילון אנגלי-אנגלי-ערבי

NATIONAL COUNCIL OF YOUNG ISRAEL. Shavuot Nation JEWISH EDITION. Compiled by Gabi Weinberg Teen Program Director

Genetic Tests for Partners of CF patients

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE D) ספרות או מילון אנגלי-עברי-עברי-אנגלי

Which Way Did They Go?

שאלון ו' הוראות לנבחן

תכנית סטארט עמותת יכולות, בשיתוף משרד החינוך א נ ג ל י ת שאלון א' Corresponds with Module A (Without Access to Information from Spoken Texts) גרסה א'

Global Day of Jewish Learning

Relationships: Everything Else is Commentary

Translation Practice (Review) Adjectives Pronouns Pronominal suffixes Construct chains Bible memory passages

Forgive us, pardon us, grant us atonement Parashat Shelach Lecha June 9, 2018 Rabbi Carl M. Perkins Temple Aliyah, Needham

Elijah Opened. Commentary by: Zion Nefesh

ניפוי שגיאות )Debug( מאת ישראל אברמוביץ

Name Page 1 of 6. דף ט: This week s bechina starts at the two dots in the middle of

Discourse Analysis

Global Day of Jewish Learning

פיזיקה של נהיגה מדריך למורה

BEAUTY AND UGLINESS. Global Day of Jewish Learning: Curriculum. A Project of the Aleph Society

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE F) ספרות מילון אנגלי-אנגלי-עברי או מילון אנגלי-עברי-עברי-אנגלי

ב. משרד החינוך בגרות לנבחנים אקסטרניים א נ ג ל י ת (MODULE B) הוראות מיוחדות: )2( בתום הבחינה החזר את השאלון למשגיח. בהצלחה!

ב "ה. ABC s of Judaism. Fundamentals of Jewish Thought and Practice. June 2007 Tammuz 5767 Jewish Educational Institute Chabad Brisbane

A lot of the time when people think about Shabbat they focus very heavily on the things they CAN T do.

Parashat Balak. Sharon Rimon

אנגלית שאלון ז' (MODULE G) ג רסה א' הוראות לנבחן )מילון אנגלי-ערבי / ערבי-אנגלי )

ANNEXURE "E1-1" FORM OF IRREVOCABLE STANDBY LETTER OF CREDIT PERFORMANCE OF CONTRACT (WHERE PRICES ARE NOT LINKED TO AN ESCALATION FORMULA)

APPROACHING MOSHIACH

ב. משרד החינוך בגרות לנבחנים אקסטרניים א נ ג ל י ת (MODULE B) הוראות מיוחדות: )2( בתום הבחינה החזר את השאלון למשגיח. בהצלחה!

Practical Session No. 13 Amortized Analysis, Union/Find

SHABBOS, 10 TAMMUZ, 5778

Eight Lights Eight Writes

Reflection Session: Sustainability and Me

כ"ג אלול תשע"ו - 26 ספטמבר, 2016 Skills Worksheet #2

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE F) ספרות או: מילון אנגלי-ערבי / ערבי-אנגלי או: מילון אנגלי-אנגלי-ערבי

Extraordinary Passages:

א נ ג ל י ת בהצלחה! ב. משרד החינוך בגרות לנבחנים אקסטרניים )מילון הראפס אנגלי-אנגלי-ערבי( השימוש במילון אחר טעון אישור הפיקוח על הוראת האנגלית.

ãówh,é ËÓÉÔê ÌW W É Å t" Y w f É ËÓÉÑ É èw É f Ñ u ð NNM YóQ' ÌW W É Y ÉgO d óqk É w f ym Éd É u ð NNM ÌWNQMH uqo ð NNM ÌWNQMH

Parts of Speech

תורשכ ירפס לכ ץבוק " ב י קלח יללכ רעש

A Hebrew Manuscript of the Book of Revelation British Library, MS Sloane 273. Transcribed and Translated by Nehemia Gordon

Bereshit / Exodus 18:1-20:23, Isaiah 6:1-7:6, 9:5-6, Matthew 6:1-8:1. Parashat Yitro

SHABBAT UNPLUGGING & RECONNECTING

Esther in Art and Text: A Role Reversal Dr. Erica Brown. Chapter Six:

Hebrew Adjectives. Hebrew Adjectives fall into 3 categories: Attributive Predicative Substantive

The Art of Rebuke. Source #1: Story of Kamtzah and Bar Kamtzah Talmud Gittin 55b-56a

שאלון ו' הוראות לנבחן

שלום SHALOM. Do you have peace with G-d? יש לך שלום עם אלוהים? First Fact. Second Fact

HEBREW THROUGH MOVEMENT

.1996) ( there is no political power without the power to control the archive. ) Henry Merryman, 2006)

קובץ לימוד י"ג אייר ר' ישראל ארי' ליב שניאורסון לה ק ואנגלית תרס"ו-תשי"ב ( )

המבנה הגאומטרי של מידה

Name Page 1 of 5. דף ז. This week s bechina begins with the fifth wide line at the top of

And now Israel, what does Hashem your G-d ask from you but to revere Hashem your G-d

שבות תחום מצוות עשה שזמן גרמא סמיכה תקיעה, שברים, תרועה. The אי ור of performing any מלאכה on Rosh HaShanah שופר in preparation of the

(MODULE E) ב ה צ ל ח ה!

DNS פרק 4 ג' ברק גונן מבוסס על ספר הלימוד "רשתות מחשבים" עומר רוזנבוים 1

Being a Man of Faith

Adam: Meet Haman. A Sermon Delivered by Rabbi Haskel Lookstein on Shabbat Bereishit October 25, 2008

הצעת תשובות לשאלות בחינת הבגרות אנגלית

Name Page 1 of 5. ,דף ד: This week s bechina starts at the bottom of שיר של חול

Jacob and the Blessings

תצוגת LCD חיבור התצוגה לבקר. (Liquid Crystal Display) המערכת.

לצפייה בפתרון בווידאו לתרגילים שבחוברת, כנסו ל "סטטיסטיקה והסתברות" בשאלון 802 שבאתר

ROLE MODELS JOLT 2014

מיהו המורה הנושר? מאפיינים דמוגרפיים,תעסוקתיים ומוסדיים של הנשירה מהוראה

Noach 5722 בראשית פרק ב

טכנולוגיית WPF מספקת למפתחים מודל תכנות מאוחד לחוויית בניית יישומיי

חוק זכויות הסוכן חוק חוזה סוכנות )סוכן מסחרי וספק(

A N A T T I T U D E O F G R A T I T U D E

ראש השנה דף. 1. A) Our משנה says,... שנראה בעליל בין שלא נראה בעליל.בין Based on this,פסוק what does the word עליל mean?

Esther אסתר. 1 Esther 1 ש ב ע ת) ה ס. ר יס" ים ה מ ש. ר " ת ים א ת פ נ י ה מ ל ך א ח ש ו ר- וש U ל ה. ב יא א ת ו ש ת G י

תכנית סטארט עמותת יכולות, בשיתוף משרד החינוך א נ ג ל י ת שאלון ב' Corresponds with Module B גרסה ב' הוראות לנבחן

Transcription:

מגמת "גילוי ואיתור מידע דיגיטלי" מידענות סייבר השתלמות מורים מובילים אפריל 2016 פרק: התמודדות עם שפה זרה

מבוא - בלשנות חישובית ועיבוד שפה טבעית מבוא לתרגום ממוכן הטכנולוגיה שמאחורי התרגום הממוכן תרגום ממוכן כצוהר למידע בשפות זרות תרגול

ענף בין-תחומי, אשר מתבסס הן על הבלשנות כמו מדעי המחשב, סטטיסטיקה ומתמטיקה בלשנות חישובית. תחומים על והן תיאורטית הבלשנות החישובית התיאורטית עוסקת בקיבוץ מגוון של המאפיינים ותחומי הידע שצריך להכיר מנת על לדעת שפה מסוימת, תוך שימוש בעקרונות מנחים מתחום הבינה המלאכותית. מעשית NLP הבלשנות החישובית המעשית גם נקראת Processing( )Natural Language ונחשבת לתת-ענף הבינה של המלאכותית. במסגרת זה תחום מפותחות טכנולוגיות חדשות אשר "מטפלות" בשפה האנושית במגוון דרכים, ויכולות לנו לסייע בחיי היום-יום ולגרום למחשבים "להבין" שפה אנושית.

בלשנות חישובית מעשית נסו לחשוב באילו תוצרים של הבלשנות החישובית המעשית אנו נתקלים במהלך היומיום? אילו טכנולוגיות המשלבות עיבוד של שפה טבעית )שפה דבורה( מוכרות לנו?

בלשנות חישובית מעשית תרגום ממוכן *** סיכום ותמצות של טקסטים *** הגייה של טקסטים כתובים )Text to Speech( *** קליטה של מילים שנאמרות בקול והעלאתן על הכתב )Speech to Text( *** מענה אוטומטי על שאלות

תרגום ממוכן כצוהר למידע בשפות זרות מיתרונות התרגום הממוכן: גישה בלתי אמצעית לחומרי גלם בשפות זרות *** שבירת חומות ומחיצות בתחום השפה *** בניית גשרים שפתיים וערוצי תקשורות חדשים *** יכולת לגלות ולאתר מידע בכל שפה, למטרות מחקר ***

מרבית מנועי התרגום כיום הם מנועי תרגום סטטיסטיים שמתבססים על סטטיסטיקות שונות על מנת לבחור את הצעות התרגום הטובות ביותר התרגום האוטומטי מבוסס על למידת מכונה המנוע מקבל אסופה ענקית של טקסטים מתורגמים, ומחלץ מהם נתונים סטטיסטיים שמאפשרים לקבל החלטות תרגומיות מושכלות

לפני שנתייחס לטכנולוגיה, חשוב ליישר קו: שפת המקור השפה שמתרגמים ממנה שפת היעד השפה שמתרגמים אליה

נתייחס לשלוש רמות של תרגום אוטומטי:

תרגום מילה במילה מה עושים כשנתקלים במילה שלא מכירים? - מחפשים במילון -

תרגום מילה במילה על אותו העיקרון בדיוק מבוסס תרגום מילה במילה מנוע התרגום פונה גדול למילון ומתרגם כל מילה בטקסט בפני עצמה... לחשוב נסו קשים אילו עשויים להיווצר כשמתרגמים מילה במילה?

קשיים דקדוקיים ותחביריים תרגום מילה במילה אם נתרגם את המשפט הבא מאנגלית לעברית: I didn t read the book הספר לא קראתי אני לראות נוכל שהרעיון המרכזי שעומד מאחורי הפלט שהתקבל אולם לנו, ברור אמנם המשפט המתורגם אינו עומד בכללי התחביר של שפת היעד.

קשיים הנובעים ממילים דו-משמעיות תרגום מילה במילה למילה הבאה יש שתי משמעויות בעברית: ק ל ס

קשיים הנובעים ממילים דו-משמעיות תרגום מילה במילה למילה הבאה יש שתי משמעויות בעברית: משמעות א' לעג וחרפה ק ל ס משמעות ב' - שבח ותהילה - אם נשתמש בתרגום מילה במילה כדי לתרגם משפט שמכיל את המילה "קלס", סביר שנקבל רשימה של כל התרגומים האפשריים למילה, ונאלץ לבחור את התרגום הרלוונטי. להניח

קשיים הנובעים ממילים דו-משמעיות תרגום מילה במילה אם נזין למנוע תרגום שמתרגם מילה במילה את המשפט הבא: The democratic party of the USA. סביר שנקבל את התרגום: המסיבה/החגיגה/המפלגה הדמוקרטית של ארצות הברית. האם מדובר במפלגה הדמוקרטית? למה התכוון המשורר? או שמא הכוונה ליום חג לדמוקרטיה?

קשיים הנובעים מהקשר המילה במשפט תרגום מילה במילה כל הקשיים בהם עסקנו קשורים בסוגייה אחת מרכזית: תרגום מילה במילה לא מתייחס להקשר המילה במשפט

קשיים הנובעים מהקשר המילה במשפט תרגום מילה במילה כך למשל ניתן לתרגם את המילה "כסף" לאנגלית בשתי דרכים לפחות: Money Silver

קשיים הנובעים מהקשר המילה במשפט תרגום מילה במילה ההקשר של המילה "כסף" משפיע על תרגומה: Silver Money השרשרת הזו עשויה כסף ומשובצת יהלומים. מיד לאחר פריצתו של השודד לבנק, צעק על הקופאית: תני לי את הכסף! כיצד מנוע התרגום הממוכן יכול להבין מתוך הקשר? איך ניתן לבחור את הצעת התרגום באופן אוטומטי?

מודל תרגום מודל התרגום בוחר את הצעת התרגום הטובה ביותר על ידי חישוב ההסתברות לפיה מילה מסוימת או ביטוי מסוים בשפה אחת יתורגמו למילה שנייה בשפה שנייה. מודל תרגום הסטטיסטיקה של מודל התרגום מחושבת על ידי מעבר על אסופה גדולה מאוד של טקסטים, שנקראת "קורפוס מקבילי".

מודל תרגום הקורפוס המקבילי מחולק למקטעים קטנים שעל בסיסם נבנית הסטטיסטיקה: השרשרת הזו עשויה כסף ומשובצת יהלומים. לאחר החלוקה למקטעים, המודל מסיק כי במרבית המקרים שבהם המילה "כסף" מגיעה בסמיכות למילים כמו "שרשרת", "יהלומים" ו"משובצת" היא תתורגם לאנגלית כ-" Silver ". This necklace is made of silver and set with diamonds.

מודל שפה לעומת השפה, מודל מילה לפיה להסתברות בשפת היעד. מודל התרגום, מתייחס או ביטוי מסוימים יופיעו מודל היעד, זה מבוסס על אסופה של טקסטים בשפת ומשפיע על הקוהרנטיות של הפלט המתקבל.

מודל שפה אם נבקש לתרגם מאנגלית לעברית את הצירוף עשויות להתקבל ארבע אפשריות תרגום שונות:,"Good boy" שפת המקור שפת היעד ילד טוב ילד טובים ילד טובה ילד טובות Good boy מודל השפה בוחן שכיחות של רצפים בשפת היעד. מכיוון שבעברית הצירוף השכיח ביותר מבין ארבע האפשריות, סביר שהצירוף יתורגם כהלכה. "ילד טוב" הוא הצירוף

כשלים תרגומיים מכיוון שמנועי תרגום ממוכן מבוססים על סטטיסטיקה ועל בינה מלאכותית, לעיתים נתקל בכשלים תרגומים, שעושיים להשפיע על היכולת להבין את המשפט המקורי. נסו לשער: באילו מקרים עשוי מנוע התרגום להתקשות בתרגום?

כשלים תרגומיים מכיוון שמנועי תרגום ממוכן מבוססים על סטטיסטיקה ועל בינה מלאכותית, לעיתים נתקל בכשלים תרגומים, שעשויים להשפיע על היכולת להבין את המשפט המקורי. מקרים בהם מנוע התרגום מתקשה: ביטויים ופתגמים צירופי מילים בשפת המקור שתרגומם )המילולי( לשפת היעד יהיה חסר משמעות. משלבים בשפה התמודדות עם סלנג ועם שפה מדוברת-כתובה, הנפוצה בפורומים ובדוא"ל. תחביר התמודדות עם מבנים תחביריים סבוכים ודו-משמעיים.

כיצד Google Translate עובד?

תרגול לפניכם מספר משפטים שתורגמו מעברית לאנגלית על ידי.Google Translate נסו לשחזר את הפתגם העברי שעומד מאחורי כל אחד מן התרגומים: No baker's own horn The shoemaker goes barefoot Third time ice cream Words of the wise are heard in comfort Do not boast wear as a key On top of a burning hat thief Pretty wise silence It is best dog friend dog author אין הנחתום מעיד על עיסתו הסנדלר הולך יחף פעם שלישית גלידה דברי חכמים בנחת נשמעים אל יתהלל חוגר כמפתח על ראש הגנב בוער הכובע השתיקה יפה לחכמים עדיף כלב חבר מחבר כלב נתחו כל אחד מן התרגומים. ממה נובע הקושי התרגומי?

תרגול בדיקת פתגם אחד לדוגמה נביט בפתגם: אל יתהלל חוגר כמפתח Do not boast wear as a key פתגם זה מדגים שני קשיים לשוניים הקשורים לתרגום הממוכן: קושי בתרגום פתגמים )מתקבל תרגום מילולי המפספס את המשמעות המקורית(. קושי סמנטי מכיוון שהתרגום הוא סטטיסטי, מתקבל תרגום מוטעה של חלק מהמילים. כך למשל במקרה של המילה "מפתח": בעוד שבפתגם מוזכרת המילה מ פ ת ח )כינוי לאיש צבא החוזר משדה הקרב ומ ת יר את נשקו( המנוע מתייחס למילה )השכיחה יותר( מ פ ת ח.)key(